曙光助力百度搜索查询应用存储系统
曙光 发表于:12年06月13日 11:00 [来稿] 存储在线
项目背景
百度是全球最大的中文搜索引擎、最大的中文网站,拥有全球最大的中文网页库,收录中文网页已超过20亿,这些网页的数量每天正以千万级的速度在增长;同时,百度在中国各地分布的服务器,能直接从最近的服务器上,把所搜索信息返回给当地用户,使用户享受极快的搜索传输速度。
百度每天处理来自超过138个国家超过数亿次的搜索请求,每天有超过7万用户将百度设为首页,用户通过百度搜索引擎可以搜到世界上最新最全的中文信息。
方案介绍
曙光存储服务器在百度的应用主要是搜索排序和查询!搜索排序,将网络爬虫抓回的网页按照关键字的匹配程度进行排序,生成索引,建立相关数据库;查询应用根据用户的请求,将对应内容进行呈现。系统的拓扑结构如下:
搜索排序要求硬件平台具有较高的处理能力,并且具有较大容量的本地存储空间,曙光公司切合用户的应用需求,采用曙光12盘位的存储服务器作为百度的搜索排序硬件平台,满足搜索排序应用对处理能力和存储能力的要求。
曙光存储服务器基于通用X86处理器平台,采用2U机架式设计,最大支持12个3.5寸热插拔硬盘仓位,可以提供高达24TB的本地高性能存储容量,有效提高搜索排序应用的相应速度。与传统的采用服务器和磁盘阵列的方案相比,曙光提供的存储服务器方案具有节省用户成本、占地面积小、管理简单、节能环保等诸多优势。
项目总结
曙光与百度的合作始于2009年。依靠稳定的产品质量,及时的供货以及完善的售后服务,曙光在百度关键应用领域的占有率不断上升,同时也为日后业务的腾飞插上了翅膀。